Περίληψη
Το κύριο ενδιαφέρον αυτής της διατριβής εστιάζεται στη στατιστική συμπερασματολογία μοντέλων που αφορούν πίνακες συνάφειας. Σημαντικό ρόλο στην αναζήτηση βέλτιστου μοντέλου παίζουν τα μέτρα απόκλισης (divergence). Τα divergence μέτρα μπορούν να χρησιμοποιηθούν για σκοπούς εκτίμησης παραμέτρων, για την κατασκευή στατιστικών ελέγχων καλής προσαρμογής ή στη στατιστική μοντελοποίηση για την κατασκευή κριτηρίων επιλογής μοντέλου. Την ίδια στιγμή, στα περισσότερα επιστημονικά πεδία, το ενδιαφέρον εστιάζεται στη στατιστική ανάλυση κατηγορικών δεδομένων. Ο συνήθης τρόπος εκτίμησης του μοντέλου γίνεται με τον παραδοσιακό Pearson chi−squared έλεγχο καλής προσαρμογής ή με τον likelihood ratio έλεγχο καλής προσαρμογής και οι άγνωστες παράμετροι εκτιμώνται με την μέθοδο της μέγιστης πιθανοφάνειας. Ωστόσο σε αρκετές περιπτώσεις αυτό μπορεί να μην οδηγήσει στα βέλτιστα αποτελέσματα, και είναι δυνατό να έχουμε καλύτερα αποτελέσματα θεωρώντας πιο γενικές οικογένειες στατιστικών ελέγχων, καθώς επίσης κα ...
Το κύριο ενδιαφέρον αυτής της διατριβής εστιάζεται στη στατιστική συμπερασματολογία μοντέλων που αφορούν πίνακες συνάφειας. Σημαντικό ρόλο στην αναζήτηση βέλτιστου μοντέλου παίζουν τα μέτρα απόκλισης (divergence). Τα divergence μέτρα μπορούν να χρησιμοποιηθούν για σκοπούς εκτίμησης παραμέτρων, για την κατασκευή στατιστικών ελέγχων καλής προσαρμογής ή στη στατιστική μοντελοποίηση για την κατασκευή κριτηρίων επιλογής μοντέλου. Την ίδια στιγμή, στα περισσότερα επιστημονικά πεδία, το ενδιαφέρον εστιάζεται στη στατιστική ανάλυση κατηγορικών δεδομένων. Ο συνήθης τρόπος εκτίμησης του μοντέλου γίνεται με τον παραδοσιακό Pearson chi−squared έλεγχο καλής προσαρμογής ή με τον likelihood ratio έλεγχο καλής προσαρμογής και οι άγνωστες παράμετροι εκτιμώνται με την μέθοδο της μέγιστης πιθανοφάνειας. Ωστόσο σε αρκετές περιπτώσεις αυτό μπορεί να μην οδηγήσει στα βέλτιστα αποτελέσματα, και είναι δυνατό να έχουμε καλύτερα αποτελέσματα θεωρώντας πιο γενικές οικογένειες στατιστικών ελέγχων, καθώς επίσης και πιο γενικές οικογένειες εκτιμητών. Υπό το πρίσμα νοθευμένων (contaminated) δεδομένων, αυτές οι γενικές οικογένειες divergence μέτρων οδηγούν σε ῾῾συμβιβασμό᾿᾿ μεταξύ της ανθεκτικότητας (robustness) και της αποδοτικότητας (efficiency) των εκτιμητών. Επιπλέον, στην περίπτωση εμφάνισης κελιών μηδενικής συχνότητας, μία τροποποιημένη (modified) εκδοχή αυτών των γενικών οικογενειών μπορεί να οδηγήσει σε ανθεκτικούς (robust) εκτιμητές οι οποίοι είναι πιο αποδοτικοί (efficient) από ότι οι κλασικοί εκτιμητές. Από την άλλη μεριά, στην περίπτωση των contaminated δεδομένων, τέτοιες γενικές οικογένειες δύνανται να παράγουν πιο ευσταθείς (stable) στατιστικούς ελέγχους, όσον αφορά το σφάλμα τύπου Ι (ή μέγεθος) (size) και την ισχύ (power) του ελέγχου. Σε αυτή τη διατριβή, μελετάμε και εκμεταλλευόμαστε τη γενική (Φ, α)−power divergence οικογένεια μέτρων απόκλισης και κάποιες προεξέχουσες υπό-οικογένειες αυτής, όπως τη BHHJ οικογένεια μέτρων. Αναφορικά με τους εκτιμητές και τους παραγόμενους στατιστικούς ελέγχους παρέχονται αυστηρά ασυμπτωτικά αποτελέσματα, ενώ η πρακτική εφαρμογή αυτών παρουσιάζεται μέσα από εκτενείς μελέτες προσομοίωσης. Σημειώνεται ότι η ανωτέρω μεθοδολογία, είναι άμεσα συνδεδεμένη με την αναλογιστική επιστήμη και μεταξύ άλλων σχετίζεται με το συλλογικό μοντέλο κινδύνου που απαντάται στις γενικές ασφαλίσεις και τη μοντελοποίηση της συχνότητας (frequency) και της σφοδρότητας (severity) των απαιτήσεων (claims) και γενικά στα οικονομικά μαθηματικά.
περισσότερα
Περίληψη σε άλλη γλώσσα
The main focus of this thesis is on model−based inferential statistics for contingency tables. The leading role in the search for an optimal modelling approach is played by divergence measures. Divergence measures can be used in statistical inference for estimating purposes, in the construction of test statistics for test−of−fit or in statistical modeling for the construction of model selection criteria. At the same time, in most scientific fields, the interest lies in statistical analysis of multivariate categorical data. A standard way for testing purposes is via the traditional Pearson’s chi−squared goodness−of−fit test statistic or by the likelihood ratio test statistic, where the unknown parameters are estimated through the maximum likelihood method. However, this procedure can lead to poor results in many circumstances and it is possible to acquire better results by considering general families of test statistics, as well as of general families of estimators. Under the set−up of ...
The main focus of this thesis is on model−based inferential statistics for contingency tables. The leading role in the search for an optimal modelling approach is played by divergence measures. Divergence measures can be used in statistical inference for estimating purposes, in the construction of test statistics for test−of−fit or in statistical modeling for the construction of model selection criteria. At the same time, in most scientific fields, the interest lies in statistical analysis of multivariate categorical data. A standard way for testing purposes is via the traditional Pearson’s chi−squared goodness−of−fit test statistic or by the likelihood ratio test statistic, where the unknown parameters are estimated through the maximum likelihood method. However, this procedure can lead to poor results in many circumstances and it is possible to acquire better results by considering general families of test statistics, as well as of general families of estimators. Under the set−up of contaminated data, regarding the estimation procedure, these general families of divergence measures impose a compromise between robustness and efficiency. Furthermore, in the situation where zero frequency cells occur, a modified version of these general families can lead to robust estimators that are more efficient than the classical ones. On the other hand, under the contaminated data regime, such general families can produce more stable test statistics regarding the size and the power of the test. In this thesis, we study and exploit the general (Φ, α)−power divergence family and prominent sub−families of it, like the BHHJ family of measures. Rigorous asymptotic results, regarding the estimators and the associated test statistics, are provided while their applicability is presented through extensive simulation studies. Note that, regarding the aforementioned methodology, there is a straightforward connection with the actuarial science, mainly associated with the collective risk model of general insurance businesses and the modelling of frequency and severity of claims, and in general with financial mathematics.
περισσότερα